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SGT 模型 在 磁 信 号 异常 检测 中 的 应 用 及 改进 思路 


摘 要 


本 报告 探究 了 SGT 模型 在 磁 探 领域 的 应 用 ， 特 别 关 注 了 其 在 MGT、SNRO 
和 SNR5 数据 集 上 的 性 能 表现 。 实 验 结果 揭示 了 SGT 模型 在 处 理 这 些 数 据 集 时 存 
在 虚 警 率 过 高 和 预测 偏差 较 大 等 问题 ,为 解决 模型 的 预测 能 力 和 泛 化 能 力 不 足 的 
问题 , 我 们 设计 了 一 系列 改进 实验 ,着重 从 调 参 、 优 化 特征 提取 方式 和 修改 连续 
性 判断 三 个 方面 入 手 。 

在 这 三 种 改进 方法 中 , 调 参 取得 了 约 0.5% 的 性 能 提升 , 特征 提取 优化 和 正 交 
基 判 断 的 方法 反而 预测 效果 降低 了 20%4。 通 过 代码 审查 和 巡 辑 推理 ， 我 们 发 现 问 
题 源 于 特征 提取 与 模型 不 兼容 。 为 适应 正 交 基 算法 ,我们 提出 一 种 改进 思路 : 引 
入 多 种 不 同类 型 的 特征 , 包括 时 域 特征 、 频 域 特征 和 统计 特征 等 ， 并 综合 利用 这 
些 特 征 信息 ， 构 建 更 为 复杂 而 全 面 的 SGT 模型 。 此 外 ， 引 入 stacking 模块 ， 将 
基于 不 同 特征 的 单一 模型 的 预测 结果 作为 输入 , 通过 进一步 的 学 习 和 综合 , 生成 
更 准确 的 预测 。 
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APPLICATION AND IMPROVEMENT STRATEGIES 
OF THE SGT MODEL IN MAGNETIC SIGNAL ANOMALY 
DETECTION 


ABSTRACT 


This report explores the application of the SGT model in the field of magnetic 
prospecting, with a special focus on its performance on the MGT, SNRO and SNR5 
datasets. The experimental results reveal that the SGT model suffers from high false 
alarm rate and large prediction bias when dealing with these datasets. To address the 
insufficient predictive and generalization abilities of the model, we designed a series 
of improvement experiments focusing on three aspects, namely, tuning parameter, 
optimizing the feature extraction method and modifying the continuity judgment. 

Among these three improvement methods, tuning parameter achieved about 
0.5% performance improvement, and the methods of feature extraction optimization 
and orthogonal basis judgment instead reduced the prediction effect by 20%. Through 
code review and logical reasoning, we found that the problem stems from feature 
extraction incompatibility with the model. In order to adapt to the orthogonal basis 
algorithm, we propose an improvement idea: introduce many different types of 
features, including time-domain features, frequency-domain features, and statistical 
features, etc., and comprehensively utilize the information of these features to 
construct a more complex and comprehensive SGT model. In addition, the stacking 
module is introduced to take the prediction results of a single model based on 
different features as inputs, and generate a more accurate ultimate prediction through 


further learning and synthesis. 


KEY WORDS: SGT, Magnetic Prospecting, Multi-feature Prediction 
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磁 信 号 异常 检测 在 地 球 科 学 和 资源 勘探 领域 中 扮演 着 关键 的 角色 , 磁 异 常 探 
测 技术 的 难点 是 磁 异 常 信号 通常 很 微弱 , 容易 受到 地 磁场 的 背景 噪声 、 仪 器 噪声 、 
电磁 干扰 等 因素 的 干扰 ， 因此 需要 对 磁 异 常 信号 进行 有 效 的 特征 提取 、 分 类 和 检 
测 。 而 SGT 模型 在 Vision Transformer 模型 基础 上 ， 改 进 了 patch split 的 构造 
结构 , 使 得 Transformer 与 Shifted-Grad Block 相 结 合 , 增强 了 一 维 数据 长 距离 
依赖 关系 ， 在 磁 数 据 上 表现 出 了 良好 效果 ， 本 文 则 在 深入 探讨 SGT 模型 "在 人 磁 信 
号 检测 中 的 具体 应 用 ， 并 简单 论述 从 实际 应 用 中 发 现 的 一 些 挑战 与 问题 


二 、 磁 信号 异常 


2.1 磁 信 号 异常 基本 概念 


磁 信 号 异常 通常 指 地 球 磁场 在 某 一 区 域 或 时 段 内 发 生 异 常 性 变化 的 现象 ,地 
球 磁 场 是 由 地 球 内 部 流动 的 液态 外 核 产 生 的 ， 因 此 地 球 的 磁场 是 动态 且 复 林 的 。 
磁 信 号 异常 可 能 是 由 地 下 的 地 质 结构 变化 、 矿产 资源 分 布 、 地壳 运动 等 引起 的 ™™。 

在 地 球 科学 和 勘探 领域 中 , 对 磁 信 号 异常 的 监测 和 分 析 有 具有 重要 价值 。 磁 信 
号 异常 的 探测 有 助 于 识别 地 下 的 地 质 特征 ， 例 如 断层 、 矿 床 、 岩 层 变化 等 。 这 对 
于 矿产 勘探 、 地 质 调查 以 及 自然 灾害 预警 等 方面 都 具有 实际 应 用 。 

检测 磁 信 号 异常 通常 需要 使 用 高 精度 的 磁力 计 或 磁力 仪器 , 通过 对 地 磁场 进 
行 测量 和 分 析 来 识别 异常 。 在 磁 信 号 异常 检测 领域 , 研究 人 员 经 常 借助 各 种 数学 
模型 、 机 器 学 习 方 法 或 深度 学 习 技 术 ， 以 提高 对 异常 信号 的 准确 性 和 敏感 性 ， 从 
而 更 好 地 理解 地 下 结构 和 地 球 动力 学 过 程 。 


2.2 磁 信 号 异常 检测 原理 


地 球 由 于 地 核 内 部 的 自由 电子 流 和 铁 磁 物质 造成 了 地 表 可 以 探测 到 的 地 磁 
场 , 通常 可 以 把 地 球 表 面 的 地 磁场 等 价 为 磁 侦 极 子 场 。 磁 异常 检测 技术 是 基于 铁 
磁 物 质 进入 原生 电磁 场 会 改变 原来 电磁 场 分 布 的 原理 。 如 汽车 、 船 舶 、 飞 机 等 铁 


人 磁 目 标 在 运动 过 程 中 会 改变 地 磁场 的 原 有 电磁 分 布 ， 称 为 磁 异 第， 如 图 2-2 中 
展示 了 铁 磁 目标 造成 的 磁 异 常 扰动 。 


图 2-2 铁 磁 目标 + 地 磁场 造成 磁 异 常 扰动 

由 于 磁 目 标 几 何 形状 比较 复杂 ， 直 接 分 析 难 度 巨大 ， 缺 乏 泛 化 性 ， 理 论 表 明 
当 探 测 器 的 探测 空间 长 度 大 于 2.5 倍 的 磁 异 常 目 标 时 ， 就 可 以 将 其 等 效 为 磁 偶 极 
子 模型 来 进行 分 析 处 理 , 而 实际 实验 场景 中 以 及 真实 环境 时 , 探测 器 一 般 是 在 几 
百 米 的 高 空中 飞行 ， 远 大 于 2.5 倍 磁 异 第 目标 尺寸 。 

以 铁 磁 目 标 为 原点 ， 飞 机 飞行 方向 为 X 轴 建立 模型 ,如 图 2-3， 其 中 M 表示 
目标 的 磁 矩 ， 工 表示 当地 地 磁场 矢量 ，r 表示 目标 到 探测 器 的 距离 矢量 ，Ro 表 示 
目标 到 探测 器 轨道 的 最 短 距 离 ， 册 和 z 表 示 目 标 磁 抢 的 偏 角 和 倾角 ， 由 和 也 表 
示 磁 偏 角 ， 碰 倾角。 


图 2-3 人 磁 异 常 测量 模型 
目标 产生 的 磁 异 党 信和 号 的 形式 为 : 
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在 实际 应 用 中 , 通常 使 用 标量 磁力 仪 检测 的 标量 磁场 进行 磁 异 常 探 测 , 理论 
研究 中 矢量 B, 为 磁 偶 极 子 场 B. 和 地 磁场 工 之 和 : 


而 B 对 应 的 标量 磁场 为 : 


$, =(T+B,)-(T+B, ) 


p T "Y. ug PO PPM 


地 磁场 强度 远大 于 磁 偶 极 子 场 ， 所 以 式 〈2-3) 可 近似 为 : 


S, = J[T[ +2T-B, - |T| zr ——Ó— sect xXQ- 4) 


假设 有 B， 当 (8 < 1 时 ， 根 据 近 似 关 系 VI+ 25 =14 B， 进 一 步 近似 上 式 


为 : 
T.B T.B 
S =T 1 Ti+ s z 
ane em MEL LLL 式 (2- 5) 


其 中 |T| 为 地 磁场 的 标量 ， 因 此 磁 侦 极 子 产 生 的 标量 磁场 时 矢量 场 在 当地 地 
磁场 方向 上 的 投影 : 


2.3 磁 信 号 异常 检测 技术 


磁 信 号 异常 检测 技术 是 一 种 利用 磁力 仪 或 磁 梯度 仪 等 仪器 测量 地 磁场 的 变 
化 ,从 而 识别 和 定位 磁性 目标 或 地 质 结 构 的 非 接触 式 感知 手段 。 磁 信号 异常 检测 
技术 有 着 广泛 的 应 用 领域 ， 如 地 质 勘 探 、 军 事 侦察 、 考 十 发 据 、 环 境 监测 等 。 磁 
信号 异常 检测 技术 的 难点 是 磁 异 常 信号 通常 很 微弱 , 容易 受到 地 磁场 的 背景 噪声 、 
仪器 噪声 、 电 磁 干 扰 等 因素 的 干扰 , 因此 需要 对 磁 异 常 信号 进行 有 效 的 特征 提取 、 
分 类 和 检测 。 

传统 的 磁 信 号 异常 检测 技术 主要 分 为 两 类 : 基于 时 域 的 方法 和 基于 频 域 的 方 


法 。 基 于 时 域 的 方法 是 直接 对 磁 异 常 信号 的 时 域 波 形 进 行 分 析 , 如 正 交 基 函 数 分 
EERI R AS o 正 交 基 函 数 分 解法 是 将 磁 异 常 信号 分 解 为 一 组 正 交 的 基 函 
数 的 线性 组 合 ,然后 根据 基 函 数 的 系数 判断 是 否 存在 磁 异 常 。 最 小 精 检测 器 是 利 
FA WES (aS EL EA EU St ht, SRE) PES BUE 认为 存在 磁 异 常 。 
这 类 方法 具有 理论 可 解释 性 和 保证 , 但 是 也 存在 误 报 率 高 、 难 以 建 模 地 磁 噪 声 等 
问题 %。 
基于 频 域 的 方法 是 先 对 磁 异 常 信号 进行 傅 里 时 变换 ， 将 其 转换 为 频 域 信号 ， 
然后 根据 频 域 信号 的 特征 进行 分 析 ， 如 高 阶 过 零 检测 器 。 高 阶 过 零 检测 器 是 利用 
磁 异 常 信号 的 高 阶 谱 的 过 零点 作为 检测 统计 量 , 当 过 零点 的 个 数 大 于 某 个 闵 值 时 ， 
认为 存在 磁 异 常 8。 这 类 方法 具有 抗 噪声 能 力 强 、 检 测 灵 敏 度 高 的 优点 ， 但 是 也 
需要 复杂 的 数据 预 处 理 和 频谱 图 生成 ， 影 响 推 理 速度 。 

传统 的 磁 信 号 异常 检测 技术 虽然 在 一 定 程度 上 实现 了 对 磁 异 常 信号 的 检测 ， 
但 是 仍然 存在 一 些 不 足 ， 如 对 磁 异 常 信号 的 特征 提取 不 充分 、 对 磁 异 常 信号 的 分 
类 和 检测 不 准确 、 对 磁 异 常 信号 的 参数 估计 不 精确 等 。 为 了 克服 这 些 不 足 ， 近 年 
来 出 现 了 一 些 基 于 机 器 学 习 的 磁 信 号 异常 检测 技术 ,如 支持 向 量 机 、 卷 积 神经 网 
络 和 循环 神经 网 络 等 ， 这 些 技术 利用 深度 学 习 的 技术 ”， 对 人 磁 异 常 信号 进行 特征 
提取 和 分 类 , 具有 泛 化 能 力 和 自 适应 性 , 但 是 也 需要 复杂 的 数据 预 处 理 和 频谱 图 
生成 ， 影 响 推 理 速度 。 

综 上 所 述 , 传统 的 磁 信 号 异常 检测 技术 是 一 种 快速 有 效 的 非 接触 式 感知 手段 ， 
但 是 也 存在 一 些 缺陷 和 局 限 性 ， 需 要 进一步 的 研究 和 改进 ， 以 提高 磁 信 号 异常 检 
测 的 准确 性 和 速度 mc 。 


SGT 模型 


3.1 SGT 模型 简介 


SGT 模型 是 一 种 基于 Transformer 的 一 维 连续 性 时 序数 据 分 析 方 法 ， 它 主要 
由 两 个 部 分 组 成 : Shifted-Grad 块 和 改进 的 Transformer 编码 器 。Shifted-Grad 
块 是 一 个 用 于 提取 一 维 数据 的 梯度 特征 的 模块 ， 它 包含 了 偏 移 模 块 、 差 分 模块 、 
原始 数据 特征 融合 模块 、 梯 度 坐 入 模块 、 多 尺度 模块 和 特征 平滑 模块 。 这 些 模 块 
通过 控制 数据 的 移 位 次 数 、 最 近邻 关系 和 距离 依赖 关系 ,构造 了 从 最 近邻 到 偏 移 


最 近邻 的 梯度 特征 ,简化 了 数据 的 预 处 理 步骤 ,增强 了 数据 的 表达 能 力 。 改 进 的 
Transformer 编码 器 是 一 个 用 于 捕捉 一 维 数据 的 长 距离 依赖 关系 的 模块 ， 它 基于 
Vision Transformer 模型 ， 改 进 了 patch 划分 的 方式 ， 使 得 Transformer 能 够 与 
Shifted-Grad 块 相 结 合 ， 提 高 了 一 维 数据 的 分 类 和 检测 性 能 。 

SGT 模型 在 多 个 一 维 连续 性 时 序数 据 的 任务 上 进行 了 实验 验证 , 包括 磁 异 常 
言 号 分 类 和 检测 、 遥 感 图 像 分 类 、 心 律 失 常 诊断 等 ， 与 现 有 的 方法 相 比 ，SGT 模 
型 不 仅 具 有 更 高 的 准确 率 和 召回 率 , 而 且 具 有 更 快 的 推理 速度 和 更 少 的 模型 参数 。 


SGT 模型 为 一 维 连续 性 时 序数 据 的 处 理 提 供 了 一 种 通用 的 框架 , 是 一 种 创新 的 尝 
试 。 
其 结构 图 如 下 图 3-1: 
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图 3-1 SGT 的 模型 结构 


3.2 SGT 模型 的 数学 原理 


SGT 模型 是 基于 Transformer 的 一 种 针对 一 维 连续 性 时 序数 据 的 分 析 方 法 ， 
它 主要 由 两 个 部 分 组 成 : SG 块 和 改进 的 Transformer。SG 块 是 用 来 从 一 维 数据 
中 提取 梯度 特征 的 模块 , 它 包 含 了 偏 移 模块 、 差 分 模块 、 原 始 数 据 特征 融合 模块 、 
梯度 散 入 模块 、 特 征 平滑 模块 和 多 尺度 模块 。 改 进 的 Transformer 是 用 来 增强 一 
维 数 据 的 长 距离 依赖 关系 的 模块 , 它 在 Vision Transformer 的 基础 上 修改 了 patch 
划分 的 方式 ， 使 得 序列 信息 得 到 保留 。 

SG 块 的 数学 原理 是 基于 数学 差分 的 概念 ， 差 分 是 用 来 近似 函数 的 导数 的 一 
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种 方法 ， 它 可 以 用 来 检测 数据 中 的 变化 率 和 突变 点 。SG 块 的 输入 是 一 个 一 维 数 
据 疝 量 x， 它 的 输出 是 一 个 梯度 特征 矩阵 G。SG 块 的 计算 过 程 如 下 : 


a) 


b) 


C) 


偏 移 模 块 ， 偏 移 模 块 是 用 来 控制 数据 的 移 位 次 数 和 方 回 的 模块 ， 它 的 目 
的 是 为 了 构造 不 同 的 邻 域 关系 和 距离 依赖 关系 。 偏 移 模 块 的 输入 是 x; 
输出 是 一 个 偏 移 矩 阵 S， 它 的 大 小 为 nxs， 其 中 n 是 移 位 次 数 ，s 是 数据 
长 度 。 偏 移 模块 的 计算 公式 为 : 


Sij =X+i i€|0,n—-1|] jEel|o,s—n-1] 


其 中 ，i 表示 移 位 次 数 ，j 表示 数据 索引 ，S 的 每 一 行 是 x 的 一 个 移 位 版 
本 。 

差分 模块 : 差分 模块 是 用 来 计算 数据 的 一 阶 和 二 阶 差分 的 模块 ， 它 的 目 
的 是 为 了 提取 数据 的 变化 率 和 曲率 。 差 分 模块 的 输入 是 S， 输 出 是 一 个 


D,j =5ij41-8 i€[0,n-1], j€[0,s—n-2)D,,;=D,j41-D i € [0,n - 1], j€l0s-n- 3] 


ij ij 


差分 矩阵 D， 它 的 大 小 为 2nx(s-n-1)。 差 分 模块 的 计算 公式 为 : 


其 中 ，i 表示 移 位 次 数 ，j 表示 数据 索引 ，D 的 前 mn 行 是 S 的 一 阶 差 分 ， 


E n fræ sS 的 二 阶 差 分 。 其 中 ，i 表示 移 位 次 数 ，j 表示 数据 索引 ，D 的 


前 n 行 是 S 的 一 阶 差分 ， 后 n 行 是 的 二 阶 差分 。 


原始 数据 特征 融合 模块 : 原始 数据 特征 融合 模块 是 用 来 保留 原始 数据 信 
恩 的 模块 ， 它 的 目的 是 为 了 不 丢失 数据 的 某 些 有 效 信息 。 原 始 数据 特征 
融合 模块 的 输入 是 x 和 D， 输 出 是 一 个 融合 矩阵 R， 它 的 大 小 为 
(2n+1)x(s-n-1)。 原 始 数 据 特征 融合 模块 的 计算 公式 为 : 


Ro,j = Xj+n j€[0.s -n - 1]R&;; =D,-1,. i € [1, 2n], FESR 1] 


其 中 ，i 表示 特征 维度 ，j 表示 数据 索引 ，R 的 第 一 行 是 x 的 一 个 截取 版 
AX, Ja 2n 行 是 D 的 复制 。 


d) 梯度 鞠 入 模块 : 梯度 嵌入 模块 是 用 来 整合 多 阶 差分 关系 的 模块 ， 它 的 目 


e) 


的 是 为 了 增强 数据 的 梯度 特征 。 梯 度 圣 入 模块 的 输入 是 R， 输 出 是 一 个 


2n 
6G,;— Wi Ry j i € [0,n — 1], 1 €][0:sS—n — 1] 
k=0 


梯度 特征 矩阵 G， 它 的 大 小 为 nx(s-n-1)。 梯 度 嵌 入 模块 的 计算 公式 为 : 


其 中 ，i 表示 特征 维度 ，j 表示 数据 索引 ，W 是 一 个 可 学 习 的 权重 矩阵 ， 


的 大 小 为 nx(2n+1)， 它 用 来 对 R 的 每 一 行进 行 加 权 求 和 ， 得 到 G 的 


B 
每 一 行 。 


特征 平 请 模块 : 特征 平滑 模块 是 用 来 使 特征 更 加 平滑 的 模块 ， 它 的 目的 


是 为 了 消除 数据 的 噪声 和 异常 值 。 特 征 平滑 模块 的 输入 是 G， 输 出 是 一 


m 
1 > : j 
ig 3 Gij+ k i € [0,n — 1], jeas n m 1] 
= -m 


个 平滑 特征 矩阵 H, 它 的 大 小 为 nx(s-n-1)。 特 征 平 滑 模 块 的 计算 公式 为 : 


其 中 ，i 表示 特征 维度 ，j 表示 数据 索引 ，m 是 一 个 超 参 数 ， 表 示 平 滑 窗 


口 的 半径 ，H 的 每 一 个 元 素 是 G 的 一 个 局 部 均值 。 


多 尺度 模块 :多 尺度 模块 是 用 来 提取 数据 的 不 同 尺度 特 征 的 模块 ， 它 的 


目的 是 为 了 增强 数据 的 多 样 性 和 和 鲁 棒 性 。 多 尺度 模块 的 输入 是 H， 输 出 


是 一 个 多 尺度 特征 矩阵 Ms 它 的 大 小 为 nx(s-n-1)。 多 尺度 模块 的 计算 公 


n—1 
M; ; = Vi Hk, j i € [0,n — 1], TEIS m A| 
k=0 
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式 为 : 


其 中 ,i 表示 特征 维度 ，j 表示 数据 索引 ，V 是 一 个 可 学 习 的 权重 矩阵 ， 


它 的 大 小 为 nxn， 它 用 来 对 H 的 每 一 行进 行 加 权 求 和 ， 得 到 M 的 每 一 


行 。 


3.3 SGT 模型 的 优点 和 局 限 性 


DH 


SGT 模型 是 一 种 基于 Transformer 的 一 维 连 续 性 时 序数 据 分 析 方 法 ， 
下 优点 和 局 限 性 : 
优点 : 
(1) ”简化 数据 预 处 理 : SGT 模型 通过 引入 偏 移 模 块 和 差分 模块 ， 扩展 
了 一 维 数 据 的 梯度 特征 空间 ， 消 除了 归 一 化 、 滤 波 、 频 谱 图 转换 等 
繁琐 的 预 处 理 操作 。 
(2) ”提高 分 类 精度 和 速度 : SGT 模型 通过 原始 数据 特征 融合 模块 、 梯 
度 谍 入 模块 、 多 尺度 模块 和 特征 平滑 模块 ， 增 强 了 一 维 数据 的 特征 
表达 能 力 ， 同 时 通过 改进 Transformer 的 patch 划分 方式 ， 保 留 了 序 
列 的 完整 性 和 长 距离 依赖 关系 。 在 多 个 一 维 连续 性 数据 集 上 ，SGT 
模型 均 取得 了 高 于 现 有 方法 的 分 类 准确 率 ， 同 时 具有 更 快 的 推理 速 
RE. 
(3) ”实现 目标 检测 : SGT 模型 通过 滑动 窗口 的 方式 , 将 一 维 连续 性 数 
据 的 目标 检测 任务 转化 为 分 类 任务 , 然后 通过 后 处 理 动态 规划 算法 ， 
消除 了 滑动 窗口 检测 结果 的 虚 警 ， 实 现 了 高 效 的 目标 检测 。 
局 限 性 : 
(1) ”不 适用 于 不 连续 性 数据 : SGT 模型 的 基本 假设 是 一 维 数据 具有 连 
续 性 ， 即 数据 之 间 的 变化 是 平滑 的 。 因 此 ， 对 于 一 些 不 连续 性 的 数 
据 ， 如 语音 数据 ，SGT 模型 的 效果 会 下 降 ， 需 要 进行 数据 转换 或 模 
型 改进 。 
(2) ”参数 调整 要 求 高 : SGT 模型 的 性 能 受 偏 移 模 块 和 差分 模块 的 参数 
设置 影响 ， 这 些 参数 需要 根据 不 同 数 据 集 进行 调整 ， 否 则 会 叶 致 特 
征 提取 不 充分 或 过 度 。 


有 具有 以 


3.4 SGT 模型 在 磁 信号 异常 检测 中 的 效果 


分 类 准确 率 : SGT 模型 在 磁 信号 分 类 任务 上 达到 了 99.01% 的 准确 率 , 超过 
了 最 好 的 基线 方法 157 个 百分点 ， 表 明了 SGT 模型 能 够 有 效 地 提取 磁 信 号 的 
特征 并 进行 分 类 。 

推理 速度 SGT 模型 每 秒 可 以 处 理 2.8x10’ 个 输入 ， 比 最 好 的 基线 方法 快 
ik 28 倍 ， 表 明了 SGT 模型 具有 很 高 的 计算 效率 和 实时 性 。 

检测 效果 : SCT 模型 通过 滑动 窗口 和 后 处 理 动 态 规划 算法 ， 实 现 了 磁 信号 
的 目标 检测 ， 能 够 准确 地 定位 磁 异 常 信号 的 起 始点 和 终止 点 ， 且 没有 出 现 虚 警 或 
漏 检 的 情况 ， 表 明了 SGT 模型 能 够 有 效 地 处 理 磁 信号 的 检测 任务 。 


3.5 SGT 模型 在 磁 信号 异常 检测 中 的 具体 应 用 方式 


二 


将 磁 信 和 号 切 分 为 长 度 为 501 个 点 的 序列 ， 作 为 SGT 的 输入 : 这 一 步 是 为 
了 将 一 维 的 磁 信 号 转换 为 适合 SCT 模型 处 理 的 形式 , 即 一 个 nxs ARBRE, 其 中 
是 特征 维度 ，s 是 序列 长 度 。 本 文选 择 了 501 作为 序列 长 度 ， 因 为 这 个 长 度 可 以 
覆盖 大 部 分 的 磁 异 常 信号 ， 同 时 也 不 会 导致 过 多 的 宛 余 信息 

使 用 SGT 模型 对 每 个 序列 进行 分 类 ,判断 是 否 含 有 磁 异 常 信 号 : 这 一 步 是 
为 了 利用 SGT 模型 的 分 类 能 力 ， 对 每 个 序列 进行 二 分 类 ， 即 是 否 含有 磁 异 常 信 

o SGT 模型 的 输出 是 一 个 nx(s-n-1) 的 矩阵 ， 其 中 nn 是 特征 维度 ，s 是 序列 长 
度 ，(s-n-1) 是 经 过 SG 块 处 理 后 的 序列 长 度 。SGT 模型 的 输出 矩阵 经 过 一 个 全 连 
接 层 和 一 个 softmax 层 ， 得 到 一 个 2x(s-n-1) 的 和 矩阵， 表示 每 个 序列 的 每 个 位 置 
的 分 类 概率 。 本 文中 选择 了 0.5 作为 分 类 闵 值 ， 即 当 某 个 位 置 的 磁 异 常 信号 的 概 
ZKT 0.5 时 ， 认 为 该 位 置 存在 磁 异 党 信号， 否则 认为 不 存在 。 

如 果 含 有 磁 异 常 信号 ， 使 用 滑动 窗口 将 序列 进一步 切 分 为 长 度 为 51 个 点 
的 子 序 列 ， 作 为 SGT 的 输入 : 这 一 步 是 为 了 对 含有 磁 异 常 信号 的 序列 进行 进 一 
步 的 细 化 ， 以 便于 确定 磁 异 常 信号 的 位 置 和 范围 。 本 文中 选择 了 51 作为 子 序列 
KE, 因为 这 个 长 度 可 以 保证 子 序列 中 至 少 包含 一 个 磁 异 常 信号 , 同时 也 不 会 导 
致 过 多 的 重合 信息 。 本 文中 使 用 了 滑动 窗口 的 方式 , 将 每 个 序列 切 分 为 多 个 子 序 
列 ， 每 个 子 序列 之 间 有 一 定 的 重 车 区 域 ， 以 避免 磁 异 常 信号 被 切 分 的 情况 。 

使 用 SGT 模型 对 每 个 子 序列 进行 分 类 ,判断 是 否 含有 磁 异 常 信号 : 这 一 步 
是 为 了 利用 SGT 模型 的 分 类 能 力 ， 对 每 个 子 序列 进行 二 分 类 ， 即 是 否 含有 磁 异 
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常 信号 。 这 一 步 与 前 面 的 步骤 相同 ， 只 是 输入 和 输出 的 序列 长 度 不 同 。 本 文中 使 
用 了 相同 的 分 类 阔 值 ， 即 0.5。 

如 果 含 有 磁 异 常 信号 ， 使 用 后 处 理 动态 规划 算法 消除 虚 警 ， 并 确定 磁 异 常 
信号 的 位 置 和 范围 ， 这 一 步 是 为 了 利用 后 处 理 动态 规划 算法 ， 对 SGT 模型 的 分 
类 结果 进行 优化 , 消除 滑动 窗口 检测 结果 中 的 虚 警 ， 并 确定 磁 异 常 信号 的 位 置 和 
范围 。 后 处 理 动态 规划 算法 的 原理 是 , 将 每 个 序列 的 每 个 位 置 的 分 类 概率 作为 状 
态 值 ， 将 每 个 序列 的 每 个 位 置 的 磁 异 常 信号 的 存在 与 否 作为 状态 转移 条 件 ， 构 建 
一 个 状态 转移 图 ， 然 后 使 用 动态 规划 算法 ， 寻 找 状 态 转 移 图 中 的 最 优 路 径 ， 即 最 
大 化 状态 值 的 和 ， 得 到 最 终 的 磁 异 常 信号 的 位 置 和 范围 。 本 文中 使 用 了 一 个 超 参 
数 ， 即 磁 异 常 信号 的 最 小 长 度 ， 作 为 状态 转移 图 的 约束 条 件 ， 以 避免 过 多 的 状态 
转移 ， 提 高 算法 的 效率 。 


四 、 实 验 设计 和 结果 分 析 


4.1 实验 方案 设计 


实验 目标 : 探索 SGT 模型 在 MGT. SNRO 和 SNR5 数据 集 上 的 性 能 ， 以 及 存 
在 的 问题 和 改进 方向 。 

数据 集 准 备 : 

MGT 数据 集 : 包含 了 不 同 地 区 、 不 同时 间 、 不 同 深 度 的 磁 信 号 数据 ， 共 有 
40000 个 样本 ， 每 个 样本 有 12 个 特征 。 

SNRO 数据 集 : 在 MGT 数据 集 的 基础 上 ， 加 入 了 信 噪 比 为 0 的 高 斯 噪声 ， 
共有 40000 个 样本 ， 每 个 样本 有 12 个 特征 。 

SNR5 数据 集 : 在 MGT 数据 集 的 基础 上 ， 加 入 了 信 噪 比 为 5 的 高 斯 噪声 ， 
共有 40000 个 样本 ， 每 个 样本 有 12 个 特征 。 

实验 步骤 ; 

数据 预 处 理 : 对 MGT. SNRO 和 SNR5 数据 集 进 行 必要 的 预 处 理 ， 包 括 数据 
清洗 、 归 一 化 等 。 

模型 训练 : 使 用 SGT 模型 分 别 对 MGT. SNRO 和 SNR5 数据 集 进 行 训练 。 记 
录 模 型 的 训练 过 程 ， 包 括 每 个 epoch 的 损失 函数 值 、 准 确 率 等 。 

模型 验证 : 使 用 验证 集 对 模型 进行 验证 ， 记 录 模 型 的 验证 结果 。 
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模型 测试 ， 使 用 测试 集 对 模型 进行 测试 ， 记 录 模 型 的 测试 结果 。 

性 能 评估 : 使 用 虚 警 率 、 漏 报 率 、 准 确 率 等 指标 对 模型 的 性 能 进行 评估 。 

结果 分 析 : 对 实验 结果 进行 深入 的 分 析 ， 包 括 模型 在 不 同 数据 集 上 的 表现 、 
模型 的 缺陷 和 错误 、 问 题 的 可 能 原因 和 解决 方法 等 。 


4.2 实验 方案 实施 


实验 环境 : 
操作 系统 显卡 配置 编程 语言 深度 学 习 框 架 
Windows | NVIDIA GeForce RTX 4070ti Python PyTorch 


数据 集 准 备 : 从 磁 探 数据 集中 下 载 MGT、SNR0 和 SNR5 数据 集 ， 分 别 保存 
为 mgt.csv. snrO.csv 和 snr5.csv 文件 ， 每 个 文件 中 有 40000 行 ， 每 行 有 12 “ME 
号 分 隔 的 数值 ， 表 示 一 个 磁 信 号 样本 的 特征 。 

数据 预 处 理 ， 对 每 个 数据 集 进行 以 下 操作 : 

(1) BER csv 文件 ， 将 数据 转换 为 numpy 数组 ， 形 状 为 (40000, 12)。 

(20. “对 每 个 样本 的 特征 进行 归 一 化 ， 使 其 均值 为 0， 标准 差 为 1。 

(3) ”将 数据 集 划 分 为 训练 集 、 验 证 集 和 测试 集 ， 比 例 为 8:1:1， 随 机 打 乱 
顺序 ， 保 证 每 个 集合 中 的 样本 均匀 分 布 。 

(4) ”将 数据 集 保存 为 torch.tensor 对 象 ， 方 便 后 续 的 模型 训练 和 测试 。 

模型 训练 ， 使 用 SGT 模型 对 每 个 数据 集 进行 训练 ， 具 体 步 又 如 下 : 

(1) ”定义 SGT 模 型 的 结构 和 参数 ,使 用 Vision Transformer 模 型 作为 基础 ， 
改进 patch split 的 构造 结构 ， 使 得 Transformer 与 Shifted-Grad Block 
相 结 合 ， 增 强 一 维 数 据 的 长 距离 依赖 关系 。 

(2) 定义 损失 函数 和 优化 器 ， 使 用 交叉 焙 损 失 函 数 和 Adam 优化 器 ， 设 
置 学 习 率 为 0.001， 权 重 衰减 为 0.0001， 批 次 大 小 为 64。 

(3) ”进行 模型 训练 , 设置 最 大 训练 轮 数 为 200,， 每 轮 结束 后 ， 使 用 验证 集 
评估 模型 的 准确 率 ， 如 果 准 确 率 在 连续 5 轮 没 有 提升 ， 或 者 达到 最 大 训 
练 轮 数 ， 停 止 训练 ， 保 存 最 佳 模型 的 参数 。 

(4) ”记录 模型 的 训练 过 程 ， 包 括 每 个 epoch 的 损失 函数 值 、 准 确 率 等 ， 
绘制 训练 曲线 ， 分 析 模 型 的 收敛 情况 和 泛 化 能 

模型 验证 : 使 用 验证 集 对 模型 进行 验证 ， 具 体 步 又 如 下 : 
(1) ”加 载 最 佳 模型 的 参数 ， 设 置 模型 为 评估 模式 ， 关 闭 梯度 计算 。 


11 


(2) ”使 用 验证 集 的 数据 ， 进 行 前 向 传播 ， 得 到 模型 的 输出 ， 计 算 模 型 的 
准确 率 ， 记 录 模 型 的 验证 结果 。 

(3) 分析 模型 在 验证 集 上 的 表现 ， 找 出 模型 的 优势 和 不 足 ， 为 后 续 的 模 
型 测试 和 结果 分 析 提 供 参 考 。 

模型 测试 ， 使 用 测试 集 对 模型 进行 测试 ， 具 体 步 又 如 下 : 

(1) ”加载 最 佳 模 型 的 参数 ， 设 置 模型 为 评估 模式 ， 关 闭 梯度 计算 。 

(2) ”使 用 测试 集 的 数据 ， 进 行 前 向 传播 ， 得 到 模型 的 输出 ， 计 算 模 型 的 
准确 率 ， 记 录 模 型 的 测试 结果 。 

(3) ”分析 模型 在 测试 集 上 的 表现 ， 与 验证 集 的 结果 进行 比较 ， 评 估 模 型 
的 稳定 性 和 和 鲁 棒 性 。 

性 能 评估 : 使 用 准确 率 、 虚 警 率 、 漏 报 率 等 指标 对 模型 的 性 能 进行 评估 ， 具 

体 步 又 如 下 : 

(1) ”对 每 个 数据 集 ， 计 算 模 型 在 测试 集 上 的 混 光 矩阵， 根据 混淆 矩阵 ， 
计算 模型 的 准确 率 、 虚 警 率 、 漏 报 率 等 指标 ， 记 录 模 型 的 性 能 评估 结果 。 

C2) 对比 模 型 在 不 同 数据 集 上 的 性 能 评估 结果 ， 分 析 模 型 对 不 同 信 噪 比 
的 磁 信 号 的 检测 能 力 ， 评 价 模型 的 优 缺 点 。 

结果 分 析 : 对 实验 结果 进行 深入 的 分 析 ， 包 括 模型 在 不 同 数据 集 上 的 表现 、 

模型 的 缺陷 和 和 错误、 问题 的 可 能 原因 和 解决 方法 等 ， 具 体 步骤 如 下 : 

(1) ”对 模型 在 不 同 数据 集 上 的 表现 进行 可 视 化 ， 使 用 折线 图 、 散 点 图 等 
方式 ， 展 示 模 型 的 训练 过 程 、 验 证 结果 、 测 斌 结果、 性 能 评估 结果 等 ， 
分 析 模 型 的 趋势 和 特征 。 

(20. “对 模型 的 缺陷 和 错误 进行 定位 ， 展 示 模 型 在 不 同类 别 、 不 同 信 噪 比 、 
不 同 特征 等 方面 的 误差 分 布 ， 分 析 模 型 的 误差 来 源 和 影响 因素 。 

(3) ”对 问题 的 可 能 原因 进行 探究 ， 使 用 相关 性 分 析 、 主 成 分 分 析 、 聚 类 
分 析 等 方式 ， 展 示 数 据 集 的 特征 和 标签 的 关系 ， 分 析 数 据 集 的 难度 和 复 
杂 度 ， 以 及 模型 的 适应 性 和 局 限 性 。 

(4) 对 解决 方法 进行 探讨 ， 使 用 参数 调整 、 模 型 改进 等 方式 ， 尝 试 提 高 
模型 的 性 能 和 准确 度 ， 分 析 改 进 的 效果 和 意义 。 
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4.3 实验 结果 分 析 
4.3.1 总 体 情况 分 析 


实验 结果 : 

模型 在 测试 集 和 验证 集 上 的 表现 : 模型 在 MGT. SNRO 和 SNR5 数据 集 上 的 
测试 集 和 验证 集 上 的 准确 率 均 达到 了 92.7%， 说 明 模 型 在 这 三 个 数据 集 上 具有 较 
高 的 预测 能 力 和 泛 化 能 

模型 在 新 测试 集 SNR1 上 的 表现 : 模型 在 新 测试 集 SNR1 上 的 准确 率 降低 到 
T 78.4%， 说 明 模 型 的 预测 能 力 和 泛 化 能 力 较 差 。 

模型 在 时 刻 点 上 的 预测 能 力 : 模型 在 预测 磁 信 号 的 时 刻 点 上 的 偏差 在 
30s-50s 之 间 ， 说 明 模 型 在 时 间 维 度 上 的 预测 精度 不 够 高 ， 可 能 存在 一 定 的 滞后 
或 超前 的 现象 。 

结果 分 析 : 

模型 在 测试 集 和 验证 集 上 的 表现 的 原因 : 模型 在 测试 集 和 验证 集 上 的 表现 较 
好 的 原因 可 能 是 由 于 SGT 模型 能 够 有 效 地 捕捉 一 维 数据 的 长 距离 依赖 关系 ， 从 
而 提高 磁 信 号 的 分 类 准确 率 。 另 外 , 模型 在 训练 过 程 中 使 用 了 交叉 焙 损 失 函 数 和 
Adam 优化 器 , 以 及 合适 的 学 习 率 和 权重 衰减 , 这 些 都 有 利于 模型 的 收敛 和 泛 化 。 

模型 在 未 出 现 的 测试 集 新 测试 集 SNR1 上 的 表现 的 原因 : 模型 在 新 测试 集 
SNR1 上 的 表现 较 差 的 原因 可 能 是 由 于 新 的 数据 集 与 训练 集 和 验证 集 存在 一 定 的 
差异 ,例如 信 品 比 、 特 征 分 布 、 样 本 数量 等 ,这 些 都 会 影响 模型 的 适应 性 和 重 棒 
性 。 另 外 ， 横 型 可 能 存在 一 定 的 过 拟 合 或 欠 拟 合 的 问题 ， 导 致 模型 在 未 见 过 的 数 
据 上 的 泛 化 能 力 下 降 。 

模型 在 时 刻 点 上 的 预测 能 力 的 原因 : 模型 在 时 刻 点 上 的 预测 能 力 不 够 高 的 原 
因 可 能 是 由 于 模型 的 结构 和 参数 设置 不 够 优化 , 导致 模型 在 时 间 维 度 上 的 特征 提 
取 和 表示 不 够 准确 和 有 效 。 另 外 , 模型 可 能 没有 充分 考虑 磁 信 号 的 动态 变化 和 周 
期 性 ， 导 致 模型 在 时 间 维 度 上 的 预测 存在 一 定 的 误差 和 偏差 。 

改进 方向 : 

为 了 提高 模型 在 未 出 现 的 测试 集 上 的 性 能 , 计划 尝试 使 用 更 多 的 数据 进行 训 
练 和 验证 , 以 增加 模型 的 数据 覆盖 度 和 多 样 性 , 从 而 提高 模型 的 适应 性 和 和 鲁 棒 性 。 
另外 ， 计 划 使 用 一 些 正则 化 技术 ， 如 Dropout. Batch Normalization 等 ， 以 减少 


模型 的 过 拟 合 或 欠 拟 合 的 风险 ， 从 而 提高 模型 的 泛 化 能 

为 了 提高 模型 在 时 刻 点 上 的 预测 能 力 ， 尝试 优化 模型 的 结构 和 参数 设置 , Bil 
如 增加 模型 的 深度 和 宽度 , 调整 模型 的 学 习 率 和 权重 衰减 等 ,以 提高 模型 在 时 间 
维度 上 的 特征 提取 和 表示 的 精度 和 有 效 性 。 另外 ,计划 在 后 续 实验 使 用 一 些 时 序 
分 析 技 术 等 ， 以 增加 模型 对 磁 信 号 的 动态 变化 和 周期 性 的 捕捉 和 建 模 ， 从 而 提高 
模型 在 时 间 维 度 上 的 预测 的 准确 度 和 稳定 性 。 


4.3.2 异常 结果 分 析 


异常 结果 分 析 一 : 连续 性 判断 中 置信 度 过 低 导 致 的 虚 警 率 过 高 
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图 4-1 连续 性 判断 中 置信 度 过 低 导 致 的 虚 警 率 过 高 

问题 描述 : 在 对 时 序数 据 进行 异常 检测 时 , 使 用 了 一 种 基于 连续 性 判断 的 方 
法 ， 该 方法 需要 设 定 一 个 置信 度 闵 值 ， 当 连续 的 数据 点 的 置信 和 度 高 于 该 闵 值 时 ， 
认为 是 异 第 点 。 然而， 由 于 置信 和 度 闵 值 设 置 过 低 ， 导 致 很 多 正常 的 数据 点 也 被 误 
判 为 异常 点 ， 从 而 造成 虚 警 率 过 高 的 问题 。 

问题 原因 : 置信 和 度 闵 值 设置 过 低 的 原因 可 能 有 以 下 几 个 方面 : 

数据 本 身 的 噪声 较 大 ， 导 致 连续 性 判断 的 不 稳定 和 不 准确 。 

数据 的 分 布 不 均匀 ， 导 致 连续 性 判断 的 不 适应 和 不 合理 。 
连续 性 判断 的 方法 本 身 的 缺陷 , 每 种 数据 集中 的 置信 和 度 区 间 都 不 一 样 ， 这 会 
导致 连续 性 判断 的 不 完善 和 不 优化 。 


问题 解决 : 为 了 解决 置信 和 度 闵 值 设置 过 低 导 致 的 虚 警 率 过 高 的 问题 , 计划 尝 
试 以 下 几 种 方法 : 

对 数据 进行 预 处理 ， 去 除 或 减少 噪声 ， 提 高 数据 的 质量 和 可 信 度 。 

对 数据 进行 分 层 或 分 组 ,根据 不 同 的 数据 特征 或 分 布 ,设置 不 同 的 置信 度 阔 
值 ， 提 高 数据 的 适应 性 和 合理 性 。 

对 连续 性 判断 的 方法 进行 改进 或 优化 , 引入 其 他 的 判断 依据 或 指标 ， 提 高 连 
续 性 判断 的 完善 性 和 优化 性 。 

异常 结果 分 析 二 : 过 拟 合 导致 的 全 警报 
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图 4-2 过 拟 合 导致 的 全 警报 

问题 描述 ; 在 对 时 序数 据 进行 异常 检测 时 ， 由 于 模型 过 拟 合 了 训练 数据 ， 导 
致 对 测试 数据 的 泛 化 能 力 很 差 ， 从 而 造成 所 有 的 数据 点 都 被 判定 为 异常 点 ， 即 全 
警报 的 问题 。 

问题 原因 : 模型 过 拟 合 的 原因 可 能 有 以 下 几 个 方面 : 

训练 数据 的 数量 不 足 ， 导 致 模型 的 学 习 能 力 不 够 充分 和 有 效 。 

训练 数据 的 质量 不 高 ， 导 致 模型 的 学 习 能 力 受 到 干扰 和 影响 。 

模型 的 复杂 度 过 高 ， 导 致 模型 的 学 习 能 力 过 于 敏感 和 细致 。 

问题 解决 : 为 了 解决 模型 过 拟 合 导致 的 全 敖 报 的 问题 , 计划 尝试 以 下 这 几 种 
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方法 : 

增加 训练 数据 的 数量 ， 使 模型 的 学 习 能 力 更 加 充分 和 有 效 。 
提高 训练 数据 的 质量 ， 使 模型 的 学 习 能 力 更 加 准确 和 稳定 。 
降低 模型 的 复杂 度 ， 使 模型 的 学 习 能 力 更 加 适度 和 平衡 。 
异常 结果 分 析 三 : 报 点 不 准确 导致 的 误差 较 大 
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图 4-3 报 点 不 准确 导致 的 误差 较 大 

问题 描述 : 在 对 时 序数 据 进行 异常 检测 时 , 使 用 的 是 基于 一 种 特征 的 提取 的 
方法 , 该 方法 需要 对 数据 进行 特征 提取 和 特征 选择 , 然后 根据 特征 的 值 判断 是 否 
为 异常 点 。 然 而 ， 由 于 在 磁 探 领域 本 身 对 多 种 特征 都 有 一 定 的 依赖 性 ， 单 特征 的 
模型 很 容易 导致 虚 警 和 不 准确 ， 这 种 情况 下 ， 预 测 结果 与 实际 的 异常 点 不 一 致 ， 
从 而 造成 报 点 不 准确 ， 即 误差 较 大 的 问题 。 

问题 原因 : 特征 提取 不 准确 的 原因 可 能 有 以 下 几 个 方面 : 

特征 提取 的 方法 不 合适 ， 导 致 特征 的 提取 不 符合 数据 的 特性 和 规律 。 

特征 提取 的 参数 不 优化 ， 导 致 特征 的 提取 不 适应 数据 的 变化 和 差异 。 

特征 提取 的 维度 不 足 ， 导 致 特征 的 提取 不 充分 和 不 完整 。 

问题 解决 : 为 了 解决 特征 提取 不 准确 导致 的 误差 较 大 的 问题 , 计划 尝试 以 下 
儿 种 方法 : 

更 换 更 加 合适 的 特征 提取 方法 ， 使 特征 的 提取 符合 数据 的 特性 和 规律 。 
调整 优化 的 特征 提取 参数 ， 使 特征 的 提取 适应 数据 的 变化 和 差异 。 
增加 特征 提取 的 维度 ， 使 特征 的 提取 充分 和 完整 。 
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4.3.3 改进 方法 测试 


问题 原因 总 结 : 在 对 给 定 的 磁 探 时 序数 据 进 行 异常 检测 时 , 出现 了 以 下 的 三 
种 问题 : 

(1) 连续 性 判断 中 置信 度 过 低 导 致 的 虚 警 率 过 高 ， 即 很 多 正常 的 数据 点 
被 误 判 为 异常 点 ， 影 响 判 断 的 准确 性 和 效率 。 

(20 过 拟 合 导 致 的 全 警报 ， 即 所 有 的 数据 点 都 被 判 员 
断 的 合理 性 和 可 信 度 。 

(3) 报 点 不 准确 导致 的 误差 较 大 ， 即 特征 的 值 与 实际 的 异常 点 不 一 致 ， 
影响 判断 的 精度 和 稳定 性 。 

改进 方向 归 类 : 针对 以 上 的 三 种 问题 出 现 的 异常 结果 , 总 结 出 可 能 的 改进 方 

向 ， 最 终 决 定 从 以 下 的 三 个 方面 进行 改进 : 

(1)” 调 参 ， 即 通过 调整 模型 或 方法 的 参数 ， 提 高 性 能 和 准确 度 ， 减 少 误 
差 和 偏差 。 

(2) ”优化 或 更 换 特征 提取 方式 ， 即 通过 选择 合适 的 特征 提取 方法 ， 或 者 
改进 现 有 的 特征 提取 方法 ， 提 高 特征 的 质量 和 有 效 性 ， 增 加 特征 的 维度 
和 多 样 性 ， 提 高 特征 与 异常 点 的 一 致 性 和 相关 性 。 

(3) ”更换 最 后 的 连续 性 判断 为 正 交 基 判 断 ， 即 使 用 正 交 基 作 为 判断 依据 ， 
而 不 是 连续 性 判断 ， 提 高 判断 的 稳定 性 和 合理 性 ， 减 少 误 判 和 虚 警 的 风 
险 ， 提 高 判断 的 精度 和 优化 性 。 

改进 方向 和 措施 阐述 : 

(1) WE: 将 置信 度 闪 值 从 0.5 提高 到 0.7， 将 学 习 率 从 0.001 降低 到 
0.0005, 将 权重 衰减 从 0.0001 增加 到 0.0005， 新 增加 正则 化 模块 ， 使 用 
dropout， 并 通过 实验 发 现 ， 其 值 在 0.2 时 效果 最 好 。 

(2) 优化 或 更 换 特 征 提 取 方 式 : 将 特征 提取 方法 从 单一 的 均值 变化 率 换 
成 多 特征 综合 提取 ， 包 括 均 值 变化 率 、 标 准 差 、 峰 度 、 偏 度 等 。 

(3) “更换 最 后 的 连续 性 判断 为 正 交 基 判 断 : 将 最 后 的 连续 性 判断 换 成 正 
交 基 判断 ， 使 用 正 交 基 作 为 判断 依据 ， 而 不 是 连续 性 判断 。 

改进 效果 和 改进 分 析 : 

(1)” 调 参 : 通过 调整 参数 ， 提 高 了 模型 和 方法 的 性 能 和 准确 度 ， 减 少 了 
误差 和 偏差 。 具 体 来 说 ， 虚 警 率 从 0.25-0.35 降低 到 0.15-0.25， 在 验证 
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集 上 的 准确 率 极 小 幅度 提高 ， 但 是 在 新 的 验证 集合 上 泛 用 性 依然 欠 佳 ， 

偏差 时 间 依 旧 在 30s-50s 波动 。 分 析 原 因 如 下 : 

> 通过 提高 置信 度 阔 值 ， 减 少 了 正常 数据 点 被 误 判 为 异常 点 的 概率 ， 
提高 了 判断 的 稳定 性 和 合理 性 。 

> 调整 的 参数 可 能 还 不 是 最 优 的 ， 还 有 进一步 的 优化 空间 ， 可 以 通过 
更 细致 的 网 格 搜索 或 者 贝 叶 斯 优化 等 方法 来 寻找 更 合适 的 参数 组 合 

> 调整 的 参数 可 能 与 其 他 的 超 参 数 或 者 模型 结构 存在 一 定 的 冲突 或 者 
不 协调 ， 导 致 模型 在 时 间 维 度 上 的 预测 精度 不 够 高 ， 光 靠 调 参 无 法 

著 提 高 性 能 ， 应 该 考虑 优化 模型 的 结构 和 参数 设置 ， 以 提高 模型 
在 时 间 维 度 上 的 特征 提取 和 表示 的 精度 和 有 效 性 。 
《2) ”实验 性 地 从 磁 探 时 序 性 数据 的 特征 换 到 另外 一 种 特征 ， 并 不 能 从 根 
本 上 改变 模型 泛 化 性 不 好 的 表现 ， 而 且 甚至 其 他 特征 预测 效果 更 差 。 有 具 
体 来 说 , 将 均值 变化 率 换 成 标准 差 后 , 虚 警 率 从 0.15-0.25 升 高 到 0.2-0.3， 
准确 率 从 0.85 降低 到 0.65。 分 析 原 因 如 下 : 
> 单一 特征 可 能 不 能 充分 反映 时 序数 据 的 复杂 性 和 多 样 性 ， 导 致 特征 
的 信息 量 和 判别 力 不 足 ， 无 法 有 效 区 分 正常 数据 和 异常 数据 。 

> 单一 特征 存在 一 定 的 噪声 或 者 异常 值 ， 导 致 特征 的 质量 和 稳定 性 不 
高 ， 影 响 特征 的 可 信和 度 和 准确 度 。 

> 单一 特征 可 能 与 异常 点 的 关系 不 明显 或 者 不 一 致 ， 导 致 特征 的 相关 
性 和 一 致 性 不 强 ， 难 以 捕捉 异常 点 的 特征 和 规律 。 

(3) 更换 最 后 的 连续 性 判断 为 正 交 基 判 断 : 但 是 这 个 方法 和 前 序 特征 融 
合 的 不 是 很 好 ， 导 致 模型 虚 警 率 升 高 到 0.35， 预 测 点 偏 移 了 40-65s， 准 

确 率 从 0.85 降低 到 0.59。 分 析 原 因 如 下 : 

> 正 交 基 判 断 的 参数 不 优化 ， 导 致 正 交 基 的 计算 不 适应 数据 的 变化 和 
差异 ， 影 响 判 断 的 稳定 性 和 重 棒 性 。 

> 正 交 基 判 断 的 维度 不 足 ， 导 致 正 交 基 的 表示 不 充分 和 不 完整 ， 影 响 
判断 的 精度 和 优化 性 。 


4.3.4 后 续 改 进 思 路 


(1) 综合 使 用 多 种 特征 进行 设计 : 引入 多 种 不 同类 型 的 特征 ， 如 时 域 特 
征 、 频 域 特征 、 统 计 特 征 等 ， 并 综合 利用 这 些 特征 信息 ， 构 建 更 为 复杂 
而 全 面 的 模型 。 这 有 助 于 提高 模型 的 鲁 棒 性 , 适应 不 同类 型 的 时 序数 据 。 

(2) ”使 用 stacking 模块 综合 多 特征 : 引入 stacking 模块 , 将 基于 不 同 特 
征 的 单一 模型 的 预测 结果 作为 输入 ， 通 过 进一步 的 学 习 和 综合 ， 生 成 更 
准确 的 终极 预测 。Stacking 模块 的 引入 有 助 于 充分 利用 各 模型 的 优势 ， 
提高 模型 整体 性 能 。 

(3) “交叉 验证 和 调 优 :， 在 实验 中 采用 交叉 验证 的 方法 ， 确 保 模型 在 不 同 
数据 集 上 都 有 良好 的 泛 化 性 能 。 通 过 调整 超 参 数 、 模 型 结构 等 进行 进 一 
步 优 化 ， 以 达到 最 佳 的 异常 检测 性 能 。 

(4) ”结果 解释 和 可 解释 性 : 对 于 最 终 的 模型 ， 进 行 结果 的 解释 和 可 解释 
性 分 析 ， 以 确保 模型 预测 的 合理 性 。 这 有 助 于 在 实际 应 用 中 更 好 地 理解 
和 信任 模型 的 输出 。 


五 、 总 结 


本 次 报告 探讨 了 SGT 模型 在 磁 探 领域 的 应 用 , 特别 是 在 MGT.SNRO 和 SNR5 
数据 集 上 的 性 能 。 实 验 结果 显示 ，SGT 模型 在 处 理 这 些 数据 集 时 出 现 了 虚 警 率 过 
高 ， 预 测 偏差 较 大 等 问题 ， 随 后 根据 模型 的 预测 能 力 和 泛 化 能 力 较 差 等 问题 设计 
了 改进 实验 ， 从 调 参 、 优 化 特征 提取 方式 和 修改 连续 性 判断 三 个 方面 入 手 设计 了 
改进 实验 , 其 中 调 参 取得 了 约 0.5% 的 性 能 提升 , 但 是 特征 提取 优化 和 正 交 基 判 断 
的 方法 还 存在 着 与 模型 不 兼容 的 问题 , 经 过 代码 审查 和 逻辑 推理 后 ， 发 现 问题 出 
在 提取 特征 与 模型 不 兼容 的 问题 ,如 果 想 要 使 用 正 交 基 代 蔡 连 续 性 判断 , 需要 整 
合 多 种 特征 ， 而 传统 的 SGT 模型 只 提取 了 单 特征 ， 因 此 无 法 满足 正 交 基 算 法 的 
使 用 条 件 ， 导致 了 最 后 的 预测 效果 反而 降低 ,最终 通过 综合 分 析 实 验 结果 和 SGT 
模型 结构 提出 一 种 新 的 改进 思路 : 

引入 多 种 不 同类 型 特征 ， 如 时 域 特征 、 频 域 特征 、 统 计 特 征 等 ， 并 综合 利用 
特征 信息 ， 将 SGT 模型 构建 更 为 全 面 的 模型 。 引 入 stacking 模块 ， 将 基于 不 同 
特征 单一 模型 的 预测 结果 作为 输入 ,通过 进一步 的 学 习 综 合 , 生成 更 准确 的 预测 。 
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